1,292 research outputs found

    Détection et résolution d'entités nommées dans des dépêches d'agence

    Get PDF
    International audienceNous présentons NP, un système de reconnaissance d'entités nommées. Comprenant un module de résolution, il permet d'associer à chaque occurrence d'entité le référent qu'elle désigne parmi les entrées d'un référentiel dédié. NP apporte ainsi des informations pertinentes pour l'exploitation de l'extraction d'entités nommées en contexte applicatif. Ce système fait l'objet d'une évaluation grâce au développement d'un corpus annoté manuellement et adapté aux tâches de détection et de résolution

    Analyse discursive des incises de citation

    Get PDF
    International audienceCet article présente une analyse complète des discours constitués d'une citation et d'une incise de citation, dont la tête est un verbe dit verbe de citation. Nous avons mené à bien cette étude grâce à un corpus de dépêches de l'AFP, dans lequel ce type de constructions est particulièrement fréquent. Nous identifions trois classes de verbes de citation : des verbes transitifs de discours rapporté (dire, déclarer), des verbes intransitifs (plaisanter, fulminer) et des verbes transitifs qui ne sont pas des verbes de discours rapporté (interrompre, commenter, continuer), ces derniers étant souvent ignorés. Nous montrons que la relation entre citation et incise de citation n'est pas purement phrastique, et notamment que la relation sémantique entre les deux ne peut être restituée qu'au niveau discursif, en prenant en compte le contexte discursif gauche de la phrase concernée. Ces résultats nous ont conduit à proposer une modélisation lexicale des verbes de citation au sein du lexique syntaxique Lefff , afin de permettre la prise en compte de ces constructions dans les analyseurs syntaxiques automatiques. Ils nous ont également amené à proposer une analyse discursive détaillée de la relation entre citation et incise de citation, où le verbe de citation est associé à un cadre de sous-catégorisation discursif distinct de son cadre de sous-catégorisation phrastique. Il s'agit d'une première étape vers une prise en compte satisfaisante de ces constructions dans un analyseur syntaxique automatique, et de son extension vers le niveau discursif

    Coopération de méthodes statistiques et symboliques pour l'adaptation non-supervisée d'un système d'étiquetage en entités nommées

    Get PDF
    International audienceNamed entity recognition and typing is achieved both by symbolic and probabilistic systems. We report on an experiment for making the rule-based system NP, a high-precision system developed on AFP news corpora and relies on the Aleda named entity database, interact with LIANE, a high-recall probabilistic system trained on oral transcriptions from the ESTER corpus. We show that a probabilistic system such as LIANE can be adapted to a new type of corpus in a non-supervized way thanks to large-scale corpora automatically annotated by NP. This adaptation does not require any additional manual anotation and illustrates the complementarity between numeric and symbolic techniques for tackling linguistic tasks.La détection et le typage des entités nommées sont des tâches pour lesquelles ont étéd éveloppés à la fois des systèmes symboliques et probabilistes. Nous présentons les résultats d'une expérience visant à faire interagir le système à base de règles NP, développé sur des corpus provenant de l'AFP, intégrant la base d'entités Aleda et qui a une bonne précision, et le système LIANE, entraîné sur des transcriptions de l'oral provenant du corpus ESTER et qui a un bon rappel. Nous montrons qu'on peut adapter à un nouveau type de corpus, de manière non supervisée, un système probabiliste tel que LIANE grâce à des corpus volumineux annotés automatiquement par NP. Cette adaptation ne nécessite aucune annotation manuelle supplémentaire et illustre la complémentarité des méthodes numériques et symboliques pour la résolution de tâches linguistiques

    Population of a Knowledge Base for News Metadata from Unstructured Text and Web Data

    Get PDF
    International audienceWe present a practical use case of knowl- edge base (KB) population at the French news agency AFP. The target KB instances are en- tities relevant for news production and con- tent enrichment. In order to acquire uniquely identified entities over news wires, i.e. tex- tual data, and integrate the resulting KB in the Linked Data framework, a series of data mod- els need to be aligned: Web data resources are harvested for creating a wide coverage entity database, which is in turn used to link entities to their mentions in French news wires. Fi- nally, the extracted entities are selected for in- stantiation in the target KB. We describe our methodology along with the resources created and used for the target KB population

    Extraction de relations et de patrons de relations entre entités nommées en vue de l'enrichissement d'une ontologie

    Get PDF
    International audienceNous proposons dans cet article une méthode non-supervisée d'extraction des relations et des patrons de relations entre entités nommées, réalisée dans le cadre de la création et l'enrichissement d'une ontologie. La méthode proposée se caractérise par l'exploitation des résultats d'analyse syntaxique, notamment les chemins syntaxiques reliant deux entités nommées dans les arbres de dépendance. Les informations sur les relations syntaxiques présentes entre les composants sont mises à profit pour le calcul de la similarité employée pour la phase principale de classification. Nous présentons également le mécanisme conçu pour l'intégration des résultats obtenus dans une ontologie

    Annotation référentielle du Corpus Arboré de Paris 7 en entités nommées

    Get PDF
    National audienceThe French TreeBank developed at the University Paris 7 is the main source of morphosyntactic and syntactic annotations for French. However, it does not include explicit information related to named entities, which are among the most useful information for several natural language processing tasks and applications. Moreover, no large-scale French corpus with named entity annotations contain referential information, which complement the type and the span of each mention with an indication of the entity it refers to. We have manually annotated the French TreeBank with such information, after an automatic pre-annotation step. We sketch the underlying annotation guidelines and we provide a few figures about the resulting annotations.Le Corpus Arboré de Paris 7 (ou French TreeBank) est le corpus de référence pour le français aux niveaux morphosyntaxique et syntaxique. Toutefois, il ne contient pas d'annotations explicites en entités nommées. Ces dernières sont pourtant parmi les informations les plus utiles pour de nombreuses tâches en traitement automatique des langues et de nombreuses applications. De plus, aucun corpus du français annoté en entités nommées et de taille importante ne contient d'annotation référentielle, qui complète les informations de typage et d'empan sur chaque mention par l'indication de l'entité à laquelle elle réfère. Nous avons annoté manuellement avec ce type d'informations, après pré-annotation automatique, le Corpus Arboré de Paris 7. Nous décrivons les grandes lignes du guide d'annotation sous-jacent et nous donnons quelques informations quantitatives sur les annotations obtenues

    The RD Parent Empowerment Program Creates Measurable Change in the Behaviors of Low-Income Families and Children: An Intervention Description and Evaluation

    Get PDF
    Dietary and physical activity habits are developed early in life and are influenced by family environments. We describe and evaluate an intervention for low-income families to encourage healthy habits. The RD Parent Empowerment Program (http://www.eatright.org/programs/kidseatright/activities/content.aspx?id=6442477891) consists of four workshops centered on the 8 Habits of Healthy Children and Families (Academy of Nutrition and Dietetics Foundation). Registered dietitian nutritionists conduct the workshops in school and community settings using a structured leader guide and tailor the communication and interactive activities to the audience. Participants are parents of young children. Our goals were to use a phenomenologic approach to elicit participant feedback, determine whether participants in the RD Parent Empowerment Program made healthier choices for their families after attending the workshops, and identify which elements of the program participants believed contributed most to its success. The evaluation design used a pragmatic, mixed-methods approach utilizing postintervention focus groups and pre–post-intervention scores on the Family Nutrition and Physical Activity (FNPA) survey. All workshop attendees aged 18 years or older were eligible to participate in the evaluation. One hundred twenty-three parents participated in the intervention across seven sites. Focus group results were analyzed using thematic analysis methods to match themes to the main intervention goals. t-Tests were used to compare pre-and post-intervention FNPA scores and demographic characteristics pooled across sites. FNPA scores significantly improved from pre- to postintervention by a mean of 4.3 FNPA points (6.5%; P\u3c0.01). Focus group participants reported behavior changes as a result of the program and identified the site leaders as integral to the program’s success, triangulating the results. The RD Parent Empowerment Program generates meaningful self-reported behavior change in parents. The long-term sustainability of the changes must be investigated

    Annotation référentielle du Corpus Arboré de Paris 7 en entités nommées

    Get PDF
    National audienceThe French TreeBank developed at the University Paris 7 is the main source of morphosyntactic and syntactic annotations for French. However, it does not include explicit information related to named entities, which are among the most useful information for several natural language processing tasks and applications. Moreover, no large-scale French corpus with named entity annotations contain referential information, which complement the type and the span of each mention with an indication of the entity it refers to. We have manually annotated the French TreeBank with such information, after an automatic pre-annotation step. We sketch the underlying annotation guidelines and we provide a few figures about the resulting annotations.Le Corpus Arboré de Paris 7 (ou French TreeBank) est le corpus de référence pour le français aux niveaux morphosyntaxique et syntaxique. Toutefois, il ne contient pas d'annotations explicites en entités nommées. Ces dernières sont pourtant parmi les informations les plus utiles pour de nombreuses tâches en traitement automatique des langues et de nombreuses applications. De plus, aucun corpus du français annoté en entités nommées et de taille importante ne contient d'annotation référentielle, qui complète les informations de typage et d'empan sur chaque mention par l'indication de l'entité à laquelle elle réfère. Nous avons annoté manuellement avec ce type d'informations, après pré-annotation automatique, le Corpus Arboré de Paris 7. Nous décrivons les grandes lignes du guide d'annotation sous-jacent et nous donnons quelques informations quantitatives sur les annotations obtenues

    The RD Parent Empowerment Program Creates Measurable Change in the Behaviors of Low-Income Families and Children: An Intervention Description and Evaluation

    Get PDF
    Dietary and physical activity habits are developed early in life and are influenced by family environments. We describe and evaluate an intervention for low-income families to encourage healthy habits. The RD Parent Empowerment Program (http://www.eatright.org/programs/kidseatright/activities/content.aspx?id=6442477891) consists of four workshops centered on the 8 Habits of Healthy Children and Families (Academy of Nutrition and Dietetics Foundation). Registered dietitian nutritionists conduct the workshops in school and community settings using a structured leader guide and tailor the communication and interactive activities to the audience. Participants are parents of young children. Our goals were to use a phenomenologic approach to elicit participant feedback, determine whether participants in the RD Parent Empowerment Program made healthier choices for their families after attending the workshops, and identify which elements of the program participants believed contributed most to its success. The evaluation design used a pragmatic, mixed-methods approach utilizing postintervention focus groups and pre–post-intervention scores on the Family Nutrition and Physical Activity (FNPA) survey. All workshop attendees aged 18 years or older were eligible to participate in the evaluation. One hundred twenty-three parents participated in the intervention across seven sites. Focus group results were analyzed using thematic analysis methods to match themes to the main intervention goals. t-Tests were used to compare pre- and postintervention FNPA scores and demographic characteristics pooled across sites. FNPA scores significantly improved from pre- to postintervention by a mean of 4.3 FNPA points (6.5%; P\u3c0.01). Focus group participants reported behavior changes as a result of the program and identified the site leaders as integral to the program’s success, triangulating the results. The RD Parent Empowerment Program generates meaningful self-reported behavior change in parents. The long-term sustainability of the changes must be investigated
    corecore